草庐IT

AI 史话

全部标签

【AI绘画】Stablediffusion必不可少的使用方法之Lora(2)

各位小伙伴们大家好,在上期我们讲过了Lora的原理和使用前景,那么这期主要要说的就是Lora应该如何使用!前提是各位小伙伴们已经下载好了Lora,Lora文件需要放在Webui文件夹内的models中的Lora目录内。Lora的使用方法有三个:(1)直接输入:在提示词框内输入,也可以输入来自己调节Lora的权重(2)附加模型选单添加:如图所示,在提示词下方的选框里,可以直接选择Lora,也可以在内检索你所需要的Lora,在这里提示一下,Lora你可以自己改名称(注意不要中文和空格),也可以用其生成图后更换你的Lora展示图片,以便你更好的区别各种Lora的风格(3)附加网络扩展:Additio

追赶OpenAI的Sora:Meta开源V-JEPA,让AI学会认识世界!

就在Sora疯狂刷屏那天,还有两款重磅产品发布:一个是谷歌的Gemini1.5,首个支持100万tokens上下文的大模型;另外一个便是全球科技、社交巨头Meta的V-JEPA。有趣的是,在功能方面V-JEPA与Sora有很多相似之处,例如,都具备让AI学会如何通过自我监督学习认识、模拟世界,以提升生成视频的质量、表示学习方法和扩大视频训练数据范围。可惜那天全世界的目光都聚焦在Sora身上,让图灵奖获得者,Meta首席科学家YannLeCuns气的直跺脚,在社交平台上各种酸Sora的成果。开源地址:https://github.com/facebookresearch/jepa论文地址:htt

本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere

一周纵览本周硅谷大厂最值得关注的,是各家的大模型均有不少上新。OpenAI宣布了多项模型更新,同时发布了GPT-4Turbo预览模型,提升了代码生成能力。Google发布文本生成视频模型Lumiere,生成视频在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖。AdeptAI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和GeminiUltra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外,第四批国产AI大模型备案获批,14款大模型及产

AI新工具(20240228) EMO - 阿里巴巴的表情驱动的音频到视频转换框架;DepthFlow;Globe Explorer等

EMO-阿里巴巴的表情驱动的音频到视频转换框架EMO(EmotePortraitAlive)是一个先进的表情驱动的音频到视频转换框架,可以通过音频(比如说话或唱歌的声音)和一张单独的参考图片,生成带有丰富面部表情和头部姿势变化的肖像视频。这个框架的显著特点是能够根据音频的长度,生成任意时长的视频,同时保持角色身份的一致性。无论是处理不同语言的歌曲、使古代画像动起来,还是生成具有逼真动作和表情的三维或AI生成内容,EMO都能够轻松应对,注入生动的动态效果。此外,它还能够驾驭快速节奏,确保快速歌词与角色动画的同步。https://humanaigc.github.io/emote-portrait

AI大预言模型——ChatGPT在地学、GIS、气象、农业、生态、环境等应用

原文链接:AI大预言模型——ChatGPT在地学、GIS、气象、农业、生态、环境等应用一开启大模型1开启大模型1)大模型的发展历程与最新功能2)大模型的强大功能与应用场景3)国内外经典大模型(ChatGPT、LLaMA、Gemini、DALL·E、Midjourney、StableDiffusion、星火大模型、文心一言、千问等)4)如何优雅使用大模型案例1.1:开启不同平台的大模型案例1.2:GPT不同版本的使用案例1.3:大模型文件上传和处理二基于ChatGPT大模型提问框架2提问框架(提示词、指令)1)专业大模型提示词,助你小白变专家2)超实用的通用提示词和提问框架3)GPTstore(

基于Springboot动漫网站和百度AI动漫转换系统设计与实现 开题报告参考

 博主介绍:黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。所有项目都配有从入门到精通的基础知识视频课程,学习后应对毕业设计答辩。项目配有对应开发文档、开题报告、任务书、PPT、论文模版等项目都录了发布和功能操作演示视频;项目的界面和功能都可以定制,包安装运行!!!如果需要联系我,可以在CSDN网站查询黄菊华老师在文章末尾可以获取联系方式 本科生毕业论文基于Java(springboot框架)动漫网站和特效处理系统开题报告学   院:                      专   业

【AI生成】无线自组网路由算法现状及未来展望

无线自组网路由算法现状及未来展望无线自组网(Adhoc网络)作为一种无需固定基础设施支持的移动通信模式,其路由算法的进展一直受到研究界的广泛关注。在现有技术条件下无线自组网路由算法已经取得了显著成就。节点之间的通信不再仅仅依赖于预设的路线,而是能够动态地调整路径,以适应环境变化和节点移动。这种灵活性是通过一系列的路由协议实现的,例如AODV(按需距离矢量路由)和DSR(动态源路由),它们能够在不预先配置网络的情况下,快速找到节点间的通信路径。然而,随着网络规模的扩大和应用场景的复杂化,现有的路由算法面临着新的挑战。例如,如何在保证网络扩展性的同时,优化路由发现的时间和能量效率?如何在节点间建立

AI与大数据:智慧城市安全的护航者与变革引擎

一、引言在数字化浪潮的席卷下,智慧城市正成为现代城市发展的新方向。作为城市的神经系统,AI与大数据的融合与应用为城市的安全与应急响应带来了革命性的变革。它们如同城市的“智慧之眼”和“聪明之脑”,不仅为城市管理者提供了强大的决策支持,还为市民创造了更加安全、便捷的生活环境。二、智慧城市面临的安全挑战随着城市规模的不断扩大和人口密度的增加,智慧城市在安全方面面临着前所未有的挑战。交通拥堵、环境污染、恐怖袭击、自然灾害等问题层出不穷,对城市的安全管理提出了更高的要求。传统的安全管理方式已经难以应对这些复杂多变的问题,急需新的技术手段来加强城市的安全防护。AI与大数据的崛起为智慧城市的安全管理带来了新

AI配音版Sora视频刷屏!绝美逼真音效打破「无声电影」,或颠覆万亿美元产业

Sora突破之后的突破又来了!语音初创公司ElevenLabs放大招,直接用AI给Sora经典视频完成了配音。网友惊呼离AI完全生成电影又近了一步。虽然一些人不想承认,但AI视频模型Sora的开年王炸,确实给影视行业带来了颠覆性的影响!OpenAISora各种逼真视频的生成足以让人惊掉下巴,有网友却表示,现在的Sora视频更像是「无声电影」。如果再给它们配上音效,现实可就真的就不存在了......就在今天,AI语音克隆初创公司ElevenLabs给经典的Sora演示视频,完成了绝美的配音。听过之后,让人简直颅内高潮。从建筑物到鲨鱼无缝切换视频中,可以听到小鸟叽喳,狗在狂吠,不同动物叫声糅杂在一

AI:139-基于深度学习的语音指令识别与执行

🚀点击这里跳转到本专栏,可查阅专栏顶置最新的指南宝典~🎉🎊🎉你的技术旅程将在这里启航!从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践都有参考学习意义。✨✨✨每一个案例都附带关键代码,详细讲解供大家学习,希望可以帮到大家。正在不断更新中~一.基于深度学习的语音指令识别与执行人工智能(AI)领域近年来取得了巨大的进展,其中深度学习成为推动技术发展的关键引擎之一。在语音处理领域,深度学习为语音指令的识别与执行提供了强大的工具。本文将重点探讨基于深度学习的语音指令识别与执行技术,并提供一个简单的代码实例来演示该技术的应用。语音交互成为现代人机交互的一种重要形式,深度